Rank in Wordlist | Frequency | Word |
---|---|---|
427 | 4533 | Татар-информ |
676 | 3139 | Премьер-министры |
746 | 2819 | азык-төлек |
957 | 2153 | торак-коммуналь |
1000 | 2063 | милли-мәдәни |
1197 | 1708 | хатын-кызлар |
1350 | 1516 | хатын-кыз |
1547 | 1352 | юл-транспорт |
1716 | 1226 | Премьер-министр |
1729 | 1216 | турыдан-туры |
1830 | 1154 | Санкт-Петербург |
1989 | 1068 | ир-ат |
2028 | 1044 | премьер-министры |
2077 | 1018 | социаль-икътисади |
2208 | 955 | әйләнә-тирә |
2314 | 915 | ата-аналар |
2594 | 814 | елдан-ел |
2713 | 782 | фәнни-гамәли |
3428 | 592 | «Татар-информ» |
3446 | 590 | премьер-министр |
Rank in Wordlist | Frequency | Word |
---|---|---|
23350 | 46 | кунакханә-сәүдә-күңел |
28928 | 33 | Ростов-на-Дону |
38008 | 21 | Би-Би-Си |
38009 | 21 | Би-би-си |
49906 | 14 | нефть-газ-химия |
51162 | 13 | Мәскәү-Санкт-Петербург |
55914 | 11 | 273-43-45 |
59054 | 10 | 291-20-02 |
62781 | 9 | 275-30-50 |
63813 | 9 | Рио-де-Жанейро |
Rank in Wordlist | Frequency | Word |
---|---|---|
121322 | 3 | Мәскәү-Санкт-Петербург-Мәскәү |
123979 | 3 | Уфа-Сергеевка-Алабуга-Болгар-Казан-Яр |
143761 | 2 | 800-200-40-40 |
144661 | 2 | Plant-for-the-Planet |
147685 | 2 | Алмания-Франция-Тунис-Маҗарстан-Швейцария-Иран-Бөек |
148006 | 2 | Арча-Кырлай-Кушлавыч-Арча |
153281 | 2 | Кама-Болгар-Казан-Алабуга-Уфа |
153282 | 2 | Кама-Болгар-Казан-Алабуга-Өфе |
156481 | 2 | Мәскәү-Самара-Уфа-Чиләбе |
156482 | 2 | Мәскәү-Санкт-Петербург-Казан |
Rank in Wordlist | Frequency | Word |
---|---|---|
123979 | 3 | Уфа-Сергеевка-Алабуга-Болгар-Казан-Яр |
147685 | 2 | Алмания-Франция-Тунис-Маҗарстан-Швейцария-Иран-Бөек |
153281 | 2 | Кама-Болгар-Казан-Алабуга-Уфа |
153282 | 2 | Кама-Болгар-Казан-Алабуга-Өфе |
209140 | 1 | 8-267-3-53-35 |
209149 | 1 | 8-800-100-03-03 |
209150 | 1 | 8-800-200-40-40 |
209151 | 1 | 8-800-775-00-00 |
240885 | 1 | Европа-Россия-Татарстан-Казакъстан-Кытай |
246254 | 1 | Казан-Болгар-Зөя-Алабуга-Казан |
Some languages allow the formation of longer word by composition using hyphens. Moreover, proper names may contain hyphens. Therefore we look for the most frequent words containing 1, 2, 3 or 4 hyphens.
Usually we find interesting words. But in the case of poor preprocessing there may be unexpected strings resulting from hyphenation etc. Words ending with an hyphen are usually not welcome, too.
For three hyphens:
select w_id-100,freq, word from words where word like "%-%-%-%" limit 10;
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots
3.12.4 Words containing special characters